人工智能与纪录片的新现实:危险还是机遇?
2022年夏末,几家科技公司对外发布第一代将文字转换为图像的“文生图”人工智能艺术生成器,自此以后,人工智能和技术伦理就成为了社会公众讨论的热门话题。
所谓“人工智能艺术生成器”,指的是基于从互联网上抓取的大量文本和视觉数据进行训练的机器学习平台。这些平台同“文生图”技术相结合,并允许用户使用非计算机编程语言的自然语言向其描述任何场景,以此根据文本提示输出若干绚丽的图像。正如IT专业杂志《PC World》所描的那样,它“获取用户生成的查询,通过人工智能算法运行,然后让算法从源图像中提取信息,并应用各种艺术技艺以生成图像”。
抛开人工智能已经成为人们日常生活一部分的事实不谈,“文生图”这种特殊技术的出现和发展在艺术界和创意产业中引发了巨大的争议。许多批评者称其为人类艺术家的“工作杀手”,而支持者则认为这是自摄影术发明以来,视觉媒体领域发生的最具革命性的事情。人工智能加持下的艺术作品生成无疑将助推深度伪造诞生,而这使人们对纪录片的未来也产生了担忧情绪。
“深度伪造”(deepfake)是“深度学习”和“伪造”的混合词,指的是利用人工智能深度学习算法对图像、视频或音频文件进行处理,通过面部交换、语音合成和图像生成等复杂技术,使其看起来或听起来与真实世界中的某些东西或某个人极为相似。
作为一种艺术流派,纪录片对虚构影像并不陌生,例如经常与采访画面一起使用的固定技巧“搬演”(reenactment)。特别是当由于某些特定原因无法获得相关事件的镜头时,搬演可以被用来构建一个连贯且有信服力的叙事,以最大化地传递真相。
在过去几年中,我们也看到许多电影制片人利用人工智能为纪录片延伸出更多可能,比如使用深度伪造技术来“重建”已故电影角色的声音。摩根·内维尔(Morgan Neville)在《流浪者:一部关于安东尼·波登的电影》(Roadrunner: A Film About Anthony Bourdain)中使用人工智能音频技术,让波登的声音“讲述”他生前写的一封电子邮件,这引起了广泛争议。在纪录片《安迪·沃霍尔:时代日记》(The Andy Warhol Diaries)中也使用了类似的技术,让“沃霍尔”的声音作为叙述旁白。Netflix在项目宣传片中谨慎地指出,安迪·沃霍尔基金会对这一创意选择给予了认可和支持,想必就是为了避免其负面影响。
亚历克斯·吉布尼 (Alex Gibney) 2016年拍摄的纪录片《零日》(Zero Days) 则另辟蹊径,讲述了互联网病毒“震网”(STUXNET)和网络战的故事。纪录片主角是一位匿名但坚定的举报人,她提供了美国和以色列情报系统为摧毁伊朗核计划而投放恶意蠕虫软件的罪证。当这位匿名举报者在结尾处透露自己是一名有偿演员时,争议便产生了——尽管她所阅读的、那些无法亲自出面作证的用户信息是真实的。这当然是一个非常有效的叙事策略,但却并不十分符合纪录片的定义。因此,这引出了这样一个问题:当一部纪录片使用深度伪造或类似技术,并将其与搬演、蒙太奇剪辑或断章取义的片段结合起来时,特别是制作过程并不完全透明的情况下,它如何能被视为一部真实的纪录片?
纪录片《零日》中的匿名举报者其实是一名有偿演员
这些问题之所以重要,是因为从电影到音乐,甚至是在ChatGPT出现后的写作,人工智能在各种媒介中的应用只会变得更加普遍。事实上,如果可以随心所欲的话,有些人甚至希望人工智能可以接管创作过程中的每一个环节:《环球邮报》2023年1月的一篇文章指出,“在 12月初的瑞银集团技术会议上,广告软件公司Viant Technology Inc.的总裁蒂姆·范德胡克(Tim Vanderhook)表示,他对广告活动的长期计划是“不需要人类参与”。
2022年11月,一系列展示90年代黑人女性金属乐迷在音乐会上的宝丽来照片在网络上迅速走红,因为这些照片中描述的人物或地点现实生活中从未存在过,这令人不可思议:每张“照片”都是由前综合格斗(MMA)选手、数字艺术家法伦·福克斯(Fallon Fox)使用人工智能图像生成程序Midjourney制作而成的。作为一名黑人艺术家,福克斯将这个项目描述为一种努力,目的是让黑人女性能够在金属乐文化中留下痕迹,这种亚文化受到许多黑人女性的喜爱,但却并不经常得到她们的回应。
这种超现实的另类愿景提出了未来历史记录的真实性问题,因为显而易见,所谓的“纪实”图像也可以通过这种方式进行伪造。鉴于现在任何人都可以以近乎完美的准确度虚构历史纪实照片,并且在互联网图像的病毒式传播过程中,其真实性很难得到核查,我们不难得出这样的结论:如果没有强大的媒体内容甄别技术,外行人、甚至资深媒体从业者都将越来越难以分辨现实和“貌似现实”。
例如,TikTok上有一个博主,他的整个频道都致力于成为“假冒的基努·里维斯”。他使用深度伪造技术,将演员基努·里维斯的脸贴在自己的脸上,面部表情异常逼真,同时在家里做一些普通的事情。从评论中可以看出,尽管他明确给自己贴上了“假基努”的标签,但很多观众刚开始还是会被这种以假乱真所吸引,并没有意识到这是一种戏仿。
当然,还有一些幽默但也令人不安的YouTube视频片段,比如脱口秀嘉宾在说话时被实时变换为其他人,或者以前的电影预告片中角色被替换成新演员的面孔和声音。
去年夏天发布的三大人工智能艺术生成器Dall-E、Stable Diffusion和Midjourney背后的公司都发表了声明,介绍了他们试图采取的保障措施,以防止产品被随意滥用。直到最近,用户还无法将真人图像上传到Midjourney或Stable Diffusion上作为艺术生成的源图像。这些公司现在可以这样做的原因被解释为更强大的内容审核系统的结果,但这还有待观察。我们真正想问的是,是哪些公司在推销这些服务?背后的支持者是谁?他们的业务和融资模式是什么?也许最重要的是,他们的最终目标是什么?
Stability AI是Stable Diffusion背后的公司,公司网站上的标语是“人工智能源于人类、为了人类——我们正在为激发人类的潜能奠定基础”。这是一个比较受欢迎的人工智能艺术平台,因为它具有开源性质——任何拥有计算机的消费者都可以下载和使用其源代码与训练模型,这与其他公司基于云技术的专有性质形成鲜明对比。
2022年7月,基于Stable Diffusion底层技术制作而成的软件Midjourney以完全测试版模式向公众开放,《PC World》将其描述为“令人着迷的艺术生成器”和“更令人回味的人工智能艺术平台”。Midjourney则将自己视作“一个探索新的思维媒介并拓展人类想象力的独立研究实验室”和“一个自筹资金并专注于设计、人类基础设施和人工智能开发的小型团队”。
Midjourney等人工智能制图工具
还有由OpenAI公司创建的、首先实现文本到图像的人工智能艺术程序DALL-E。OpenAI是一家美国人工智能研究实验室,一直公开宣称“构建友好的人工智能”是他们的最终目的。而这一点,加上通过人工智能实现人类潜能的各种理想,似乎是这些公司的普遍目标。
另一方面,人工智能技术也被纪录片制作人以各种方式使用,尤其在用来保护易受攻击的消息来源和采访对象这一方面。出于安全考虑,大卫·弗朗斯 (David France) 的纪录片《欢迎来到车臣》(Welcome to Chechnya)就使用了人工智能技术来隐藏拍摄对象的身份。这让人想起约书亚·奥本海默(Joshua Oppenheimer)的杰作《杀戮演绎》(The Act of Killing),其中所有的印尼演员和工作人员都是“匿名”的,以防止他们及其家人在影片上映后遭到报复。使用人工智能似乎是这种趋势的进一步延伸,只是这一次以另一种更为自然的形式呈现了出来。
纪录片《欢迎来到车臣》因其使用人工智能技术保护拍摄群体身份而广受赞誉
与人类所有的革命性发明一样,人工智能也是一把双刃剑。随着技术的不断发展,以事实为基准的媒体内容需要怎样才能保持其可信度,让讲述的故事尽可能接近客观事实,并用原始素材或补充性数据来证明这一点?又如何拥抱并重新定义其艺术类型,以及技术所带来的更多可能性?
自2016年特朗普就任美国总统以来,“假新闻”一词变得无处不在,网络评论员们经常用其反驳他们个人不同意的论点。当观众开始质疑银幕上影像的真实来源时,是不是也会采取这种怀疑的、封闭的态度,而这种态度又会变得多么普遍?纪录片作为一种艺术类型,一向因其影像素材详实、事实核查精准、故事内容真实而享有盛誉,但这种令人毫不怀疑的可靠恐怕要到此为止了。
技术影响下的“新现实”对于纪录片界来说是危险还是机遇?我们不得而知。但面对人工智能与深度伪造技术所带来的真实性与伦理问题,纪录片行业内应该有所应对、主动求变,而非被动等待。
监制:何苏六
主编:韩 飞
责编:王 侯 李金斋
编辑:李嘉婧